import pandas as pd


# 创建DataFrame

data ={
    'Name':['Alice','Bob','Charlie','David','hm'],
    'Age':[25,30,35,40,20],
    'City':['New York','Los Angeles','Chicago','Houston','Houston']
}

df = pd.DataFrame(data)
print(df)
# # 查看前两行数据
# print("="*25+"查看前两行数据"+"="*25)
# print(df.head(2))
#
# # 查看DataFrame的基本信息
# print("="*25+"查看DataFrame的基本信息"+"="*25)
# print(df.info())
#
# # 获取描述统计信息
# print("="*25+"获取描述统计信息"+"="*25)
# print(df.describe())


# 按年龄排序
# df_sorted = df.sort_values(by="Age",ascending=False)
# print("="*25+"按年龄排序"+"="*25)
# print(df_sorted)


# 选择指定列
# print("="*25+"选择指定列"+"="*25)
# print(df[['Name','Age']])

# 按索引选择行
# print("="*25+"按索引选择行 选则第二到第三行（按位置）"+"="*25)
# print(df.iloc[1:3]) # 选则第二到第三行（按位置）


# 按标签选择行
# print("="*25+"按标签选择行"+"="*25)
# print(df.loc[1:2])


# 计算分组统计（按城市分组，计算平均年龄）
print("="*25+"计算分组统计（按城市分组，计算平均年龄）"+"="*25)
print(df.groupby('City')['Age'].mean())

# 处理缺失值（填充缺失值）
df['Age'] = df['Age'].fillna(30)

# 导出为CSV文件
df.to_csv('output.csv',index=False)